1. \w - используем для последовательности [0-9a-zA-Z_] 2. Для поиска кириллических символов используем [а-яА-ЯёЁ] 3. Для строк Юникода используем модификатор u 4. Аккуратно работаем с символьными классами в режиме Юникода